Compresión de LLM eliminando bloques con optimización binaria Descubre cómo comprimir modelos de lenguaje eliminando bloques con optimización binaria. Logra un 23% más en MMLU al 50% de compresión. Eficiente y general. 2026-06-18 · 1 min